Ce projet à pour objet l'étude des données du Vendée Globe 2020, course de voilier en solitaire autour du monde. Nous allons pour cela nous appuyer sur des mesures effectuées sur les différents voiliers plusieurs fois par jours. Pour des raisons pratiques nous étudierons ces données jusqu'à l'arrivée du 1er voilier.

Extraction des données

Au final, nous avons pu extraire 482 fichiers similaires dans leurs formats allant du 8 novembre 2020 au 27 janvier 2021.

Data-cleaning et mise en forme du dataframe

df.to_excel("Classement.xlsx")

Exploration des données

Maintenant que les données sont extraites et exploitables au sein d'un dataset, il convient de les exploiter. Pour cela on va s'interesser à 2 aspects du Vendée Globe. L'impact de la vitesse sur le classement et les abandons.

Sans suprise, on s'apercoit que les 3 skippers sur le podium font partie des plus rapides (Bien que le cas de Yannick Bestaven soit particulier).

En tracant une droite de regression, on voit clairement qu'une augmentation de la vitesse moyenne à pour effet direct d'augmenter son classement. Cependant ce n'est pas le seul determinant car le coefficient de determination n'est que de 0,65. A partir de cette droite de regression on peut se permettre de faire une estimation du rang en fonction de la vitesse moyenne (ici le point orange).

Interessons nous maintenant aux abandons. Chaque année de nombreux abandons son constatés tout au long de la compétition.

Un rapide regard sur le nombre de participants montre aussi qu'il y'a eu plusieurs abandons au cours de la course, passant de 33 participants à 24 à la fin. Mais observons ces 9 abandons de plus près.

On voit sur ce tableau que certains skippers ont abandonné dès le début de la course comme Nicolas Troussel alors que d'autres ont abandonnés en fin de course comme Arnaud Boissières.

Sur cette carte interactive, nous pouvons observer le trajets des 9 skippers qui ont abandonnés (en selectionnant les skippers sur la droite) et voir le point géographique exacte pour chacun des abandons. Le plus souvent au passage d'un cap (au sud de l'Afrique ou de l'Amerique du sud)

Interessons nous maintenant aux données techniques sur les bateaux.

Extraction des spécificités des voiliers

On fusionne ensuite les 2 tableaux en 1 à partir de la colonne 'Numéro de voile' présente dans les 2 tableaux

Courte exploration des données

Cette courte exploration des données consiste à observer si il y a un lien entre le classement et la surface des différentes voiles. Cependant, on voit que cette caractérisque ne semble pas déterminante dans la course puisqu'aucune tendance ne ressort du graphe.

Conclusion

Au cours de ce projet, nous avons extrait et analyser différentes données du Vendée Globe. Il en ressort :

A noter cependant que les tailles de voiles sont assez similaires entre les voiliers.